OpenAI Five
2018年にOpenAIから公開されたDota 2においてプロを打倒できるとしたゲームAI
ディープニューラルネットワークにLSTMを用いて,PPOという強化学習のアルゴリズムを用いた5つのエージェントのチームからなる.
膨大な計算資源と学習時間に特徴がある.
10ヶ月くらい強化学習したらしい.